Národní úložiště šedé literatury Nalezeno 5 záznamů.  Hledání trvalo 0.00 vteřin. 
Rozšíření Apache Tika o extrakci textu ze souborů průmyslových formátů
Rešetár, René ; Burget, Radek (oponent) ; Rychlý, Marek (vedoucí práce)
Cieľom bakalárskej práce bolo rozšíriť syntaktické analyzátory projektu Apache Tika o extrakciu tabuliek a dát z priemyslových formátov dokumentov z laboratórnych prístrojov. Tieto dáta majú byť uložené v štruktúrovanom formáte podľa určitej schémy. V teoretickej časti boli preskúmané dodané industriálne formáty, projekt Apache Tika a možnosti jeho rozšírenia. V praktickej časti bol navrhnutý a implementovaný nástroj, ktorý dokumenty pomocou projektu Apache Tika klasifikuje, spracuje, vytvára z nich štruktúrované dáta vo formáte JSON a tie následne validuje. Na záver bola vytvorená sada testov pre overenie a demonštráciu vlastností riešenia.
Automatické generování testovacích dat informačních systémů
Naňo, Andrej ; Fiedor, Tomáš (oponent) ; Smrčka, Aleš (vedoucí práce)
Nastroj ISAGENumoznuje automaticke generovanie komplexnych sturkturovanych testovacich vstupov imitujucich realnu komunikaciu z prostredia modernych informacnych systemov. Komplexne data, typicky so strukturou stromu v sucasnosti predstavuju zakladny transportacny prostriedok pre prenos informacii medzi uzlami distribuovanych informacnych systemov. Automaticky generator ISAGENvychadza z metodologie datami riadeneho testovania a vyuziva konkretne data z produkcneho prostredia ako hlavnu charakteristiku a specifikaciu pre riadenie generovania novych podobnych dat pre testovacie pripady splnajuce zadane kombinacne kriteria. Hlavnym prinosom tejto prace je obsiahle predlozenie technik pre automatizovane generovanie dat spolocne s praktickou implementaciou, ktora demonstruje ich pouzitie. Vytvorene riesenie umoznuje testerom vytvarat viac relevantne testovacie data, ktore vhodne reprezentuju realnu komunikaciu z produkcnych informacnych systemov.
Automatické generování testovacích dat informačních systémů
Naňo, Andrej ; Fiedor, Tomáš (oponent) ; Smrčka, Aleš (vedoucí práce)
Nastroj ISAGENumoznuje automaticke generovanie komplexnych sturkturovanych testovacich vstupov imitujucich realnu komunikaciu z prostredia modernych informacnych systemov. Komplexne data, typicky so strukturou stromu v sucasnosti predstavuju zakladny transportacny prostriedok pre prenos informacii medzi uzlami distribuovanych informacnych systemov. Automaticky generator ISAGENvychadza z metodologie datami riadeneho testovania a vyuziva konkretne data z produkcneho prostredia ako hlavnu charakteristiku a specifikaciu pre riadenie generovania novych podobnych dat pre testovacie pripady splnajuce zadane kombinacne kriteria. Hlavnym prinosom tejto prace je obsiahle predlozenie technik pre automatizovane generovanie dat spolocne s praktickou implementaciou, ktora demonstruje ich pouzitie. Vytvorene riesenie umoznuje testerom vytvarat viac relevantne testovacie data, ktore vhodne reprezentuju realnu komunikaciu z produkcnych informacnych systemov.
Rozšíření Apache Tika o extrakci textu ze souborů průmyslových formátů
Rešetár, René ; Burget, Radek (oponent) ; Rychlý, Marek (vedoucí práce)
Cieľom bakalárskej práce bolo rozšíriť syntaktické analyzátory projektu Apache Tika o extrakciu tabuliek a dát z priemyslových formátov dokumentov z laboratórnych prístrojov. Tieto dáta majú byť uložené v štruktúrovanom formáte podľa určitej schémy. V teoretickej časti boli preskúmané dodané industriálne formáty, projekt Apache Tika a možnosti jeho rozšírenia. V praktickej časti bol navrhnutý a implementovaný nástroj, ktorý dokumenty pomocou projektu Apache Tika klasifikuje, spracuje, vytvára z nich štruktúrované dáta vo formáte JSON a tie následne validuje. Na záver bola vytvorená sada testov pre overenie a demonštráciu vlastností riešenia.
ScraperWiki Tutorial
Levine, Thomas
The objective of the workshop, or better hackathon, was to get the data into a structured format, and join it with data from another sources – together with an overview and showing by example what is possible with scraping. Thomas identified targets for web scraping and navigating the complexity of different types of web pages and introduced that in a few half-hour-long and hour-long modules that catered to different audiences.
Prezentace: Stáhnout plný textPDF

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.